前一天我們介紹了Cloud Speech API和Translation and NL,今天來介紹監督式與非監督式學習
前面我們花了好幾天的時間,總算把第一部分的How Google does Machine Learning給完成,整體感覺課程滿充實的,以前在學習機器學習的時候都是邊寫程式邊學比較多,很少有Coursera這種介紹理論佔多數的課,讓我一次把以前不懂的觀念打通,讓我印象滿深刻的是認識到許多Google所開發的機器學習應用,也感謝這次ML Study Jam所舉辦的活動,讓我們能用免費學習機器學習相關知識還有拿到證書
講師在前面提到許多Google使用機器學習的過程和一些產品,現在要來談到機器學習的歷史,其中一個重要的部分是監督式機器學習,有監督和非監督式兩種,主要的差別在於監督式機器學習有正確答案的數據給機器來學習,幫助他認識我們的資料有什麼規則,資料是有標籤可以依循的,而非監督式學習就如同名字所寫,資料沒有標籤可依循,資料任由機器去學習和分群,透過監督式學習我們可以使用歷史的資料進行預測我們所不知道的事物。
在監督式學習中能分成兩類型的問題:迴歸和分類,可以用下面這張圖說明
課堂當中使用餐廳消費的帳單做例子,其中小費就屬於迴歸標籤,性別屬於類別標籤,如果說今天的問題是我想要預測小費的金額,那我可以拿其他的標籤像是total_bill、sex、smoker、day、time等標籤來做成機器學習模型,要選用什麼樣的標籤當作欄位就要取決於你對於領域知識的了解,反之如果資料沒有標籤,我們就沒辦法用監督式學習,也就不得不用非監督式學習的分群的方法幫助我們找到一些可用的標籤屬性。
所以說你擁有什麼樣的資料,以及他含有什麼樣的標籤會決定你使用監督式或非監督式學習來訓練你的模型,或著說你不清楚你的資料接下來該怎麼做,可以使用下圖的分類樹協助你做選擇。
今天先介紹到這,明天我們來介紹機器學習的分類與迴歸問題。